
一个「always」站在大模型技术C位的传奇男子
一个「always」站在大模型技术C位的传奇男子怎么老是你???(How old are you)尤其是最近Meta FAIR研究员朱泽园分享了他们《Physics of Language Models》项目的系列新进展后,有网友发现,其中提到的3-token因果卷积相关内容,沙哥等又早在三年前就有相关研究。这是最近网友不断对着Transformer八子之一的Noam Shazeer(为方便阅读,我们称他为沙哥)发出的灵魂疑问。
来自主题: AI资讯
8807 点击 2025-05-11 15:02